来源:2020-03-31 16:35:01 热度:

一步到位!!百度大脑语音合成快速搞定会员到访提醒功能

AI中国网 https://www.cnaiplus.com

每次会员到访都需要。会员自主结账或找导购才能被发现。或者需要一个人员站在门口,并且对会员都全部了解,才能对会员到访进行更好服务的接待。

小帅为了免去这些操作呢。就想到了百度AI。语音合成。再结合第三方的人脸库会员到访推送。做了一个简单的会员到访语音提醒推送小工程。

下面我们就一起看一下整体流程吧~

实现步骤 Step1:成为百度AI开放平台的开发者

src=http://img.crmupload.com/9fe03640.jpg

我们有账号之后登录,并且点击此处(百度语音)创建一个应用,如下图

src=http://img.crmupload.com/ddce9b06.jpg

然后就能看到创建完的应用和 APPID、API KEY 以及 Secret KEY

src=http://img.crmupload.com/5baa84a4.jpg

Step2:准备数据

语音合成是将文本转换为可以播放的音频文件的服务,我们从大姚的订单库中找一段订单信息的文本如下:

三分钟前,由北京市顺义区二经路与二纬路交汇处北侧,北京首都国际机场T3航站楼 去往 东城区北三环东路36号喜来登大酒店(北京金隅店)

Step3: 编写一个语音合成示例程序

有 第一步 的 API KEY 以及 Secret KEY,以及 第二步 的数据,我们就可以写一个示例代码调用百度AI开放平台的文字识别能力

准备开发环境

小帅选择用 Java来快速搭建一个原型,关于如何安装Java。可以参考百度经验哦~。百度AI有很完善的API文档、和封装调用更方便的工具包。接下来小帅就用Maven搭建工程环境

pom.xml配置如下:

xml请自行访问网页 复制

编写代码

粘贴以下内容,不要忘记替换你的 APPID APIKEY 以及 SECRETKEY 和 图片文件

运行main方法即可

src=http://img.crmupload.com/ccc12f33.jpg

src=http://img.crmupload.com/7005279b.jpg

保存接口返回语音byte[] 转存为MP3格式文件。这里说明一下默认返回就是MP3格式的数据哦。如果想要其他格式

src=http://img.crmupload.com/765680a9.jpg

点击访问合成的示例MP3文件 https://www.ydxiaoshuai.cn/demo.mp3

语音合成 单例加载。10次测试耗时如下(单位:ms(毫秒))。第一次需要加载一次AUTH。耗时多了一些。后续基本都持平在710ms以内

src=http://img.crmupload.com/59175185.jpg

src=http://img.crmupload.com/5a09f12d.jpg

src=http://img.crmupload.com/ed636ccc.jpg

系统配置-小帅认为速度和配置 带宽都存在一定的因素

src=http://img.crmupload.com/4e094b6d.jpg

以上数据可以看出。平均耗时在0.7s上下。如果服务器配置贼6、带宽也贼宽。应该耗时还会更低。

接下来就拿语音合成的服务,来结合实际业务做一个小的功能。

会员到访语音提醒搞起来

简单看一下业务流程图。主要看语音合成、语音提醒部分即可

人脸会员识别可以看百度AI的官方解决方案 https://ai.baidu.com/solution/faceidentify

src=http://img.crmupload.com/01e8b15c.jpg

会员信息采集

会员到访提示音发音类型默认度米多,也可以根据会员不同给不同的发音类型。

src=http://img.crmupload.com/e82c5633.jpg

下拉框

src=http://img.crmupload.com/a2e2cacf.jpg

后端会员人脸信息处理

 

src=http://img.crmupload.com/afa7f7ab.jpg

 

会员到访定制提示音频合成定时任务

src=http://img.crmupload.com/b2b22305.jpg

src=http://img.crmupload.com/8a684441.jpg

src=http://img.crmupload.com/cde4f2ea.jpg

src=http://img.crmupload.com/aa63f2a2.jpg

src=http://img.crmupload.com/f0808bcb.jpg

src=http://img.crmupload.com/9ef0933e.jpg

添加一条定时任务

这里是5秒执行一次。其实可以根据自我需求来定义。定时任务形式也不是必须。

src=http://img.crmupload.com/87b219e9.jpg

会员音频提示文件生成

数字代表的是发音类型。每添加一个会员。则会生成所有发音类型的音频文件哦。方便后续给每个到访会员给定不同声音的提醒

src=http://img.crmupload.com/407aa430.jpg

会员到访APP推送

1.摄像头抓怕推送到人脸库系统

2.人脸库系统对比并推送结果到内部业务系统

3.内部业务系统|人脸库系统推送给APP(小帅使用前者)

下图是一个gif。会演示app收到推送弹窗并播放语音提醒。带声音的等小帅后续上传到第三方网站方便大家查看效果。

src=http://img.crmupload.com/63fd5b89.gif

视频录屏APP推送会员到访并播放会员专属语音

src=http://img.crmupload.com/99032eed.jpg

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。



AI中国网 https://www.cnaiplus.com

本文网址:

欢迎关注微信公众号:人工智能报;合作及投稿请联系:editor@cnaiplus.com

AI中国号...

关注微信公众号,了解最新精彩内容